[アップデート] Amazon PollyおよびAmazon Connectに新しい日本語の音声「Kazuha」「Tomoko」が追加されました
みなさん、こんにちは!
福岡オフィスの青柳です。
Amazon Pollyで利用できる日本語の音声の種類 (話者) に「Kazuha」と「Tomoko」が追加されていることが確認できました!
Amazon Pollyの公式ドキュメントの更新履歴 (英語版) に、当アップデートが記載されています。
Document History for Amazon Polly - Amazon Polly
2023-02-09 追記:
本日、AWSの「What's new」でもアップデートについて周知されています。
Amazon Polly launches two new Japanese NTTS voices
また、自動アナウンスのテキスト読み上げでAmazon Pollyのテクノロジーを利用しているAmazon Connectにおいても、同様に「Kazuha」と「Tomoko」が使えるようになっています。
試しに聴いてみよう
早速ですが、追加された2種類の音声を試してみましょう。
マネジメントコンソールで「Amazon Polly」ページを開き、メニューから「テキスト読み上げ機能」を選択します。
「エンジン」の選択を「ニューラル」、「言語」の選択を「日本語」にした状態で、「音声」の選択を試みると、これまで選択可能だった「Takumi」「Mizuki」に加えて、新たに「Kazuha」「Tomoko」が選択可能になっています。
右上の「音声を聴く」ボタンを押すと、どのような音声なのか実際に聴くことができます。
私が聴いた印象ですが、「Kazuha」は従来の「Mizuki」よりも明るい感じ、「Tomoko」は少し落ち着いた感じがしました。(個人の感想です)
ちなみに、「Kazuha」「Tomoko」は漢字で表記すると「和葉」「智子」であるようです。
音声の種類を選択すると自動的にセットされる「入力テキスト」のサンプルを見ると、ちゃんと漢字で名前を名乗っているのです!
(「Takumi」と「Mizuki」はそれぞれ「たくみ」「ミズキ」なんですよね・・・)
「ニューラル」「スタンダード」の対応有無について
今回新たに追加された2種類の音声ですが、注意しておくべき点が一つあります。
Amazon Pollyの音声には「ニューラル」「スタンダード (標準)」の2種類の「エンジン」があります。
- ニューラル: 新しいエンジンであり、従来の「スタンダード」に比べて自然な話し方ができる
- スタンダード: Amazon Pollyサービス開始当初からある従来のエンジン
「ニューラル」と「スタンダード」は利用料金にも違いがあり、「ニューラル」の方が「スタンダード」よりも高い単価が設定されています。
料金 - Amazon Polly | AWS
今回追加された「Kazuha」「Tomoko」なのですが、いずれも「ニューラル」のみ指定できるようになっています。
(「スタンダード」を指定しようとすると、下図のように「サポートされていません」となってしまいます)
なお、従来の「Takumi」は「ニューラル」「スタンダード」の両方に対応、「Mizuki」は「スタンダード」のみの対応となっています。
日本語話者の各音声の仕様について整理しますと、下表のようになります。
音声 (名前) | 性別 | ニューラル | スタンダード | 備考 |
---|---|---|---|---|
Takumi | 男性 | 対応 | 対応 | |
Mizuki | 女性 | 非対応 | 対応 | |
Kazuha | 女性 | 対応 | 非対応 | 今回追加 |
Tomoko | 女性 | 対応 | 非対応 | 今回追加 |
Amazon Connectで新しい音声を使う
確認したところ、Amazon Connectでも新しい音声「Kazuha」「Tomoko」が使えるようになっていました。
コンタクトフローに配置した「音声の設定」ブロックで、プロパティ画面の「音声」から「Kazuha」「Tomoko」が選択可能になっていることを確認しました。
(もちろん、新しい音声を設定したコンタクトフローを使ってAmazon Connect上で通話を行うと、Amazon Pollyと同様に「Kazuha」「Tomoko」の声でアナウンス (音声プロンプト) が流れることを確認しています)
なお、「音声の設定」ブロックで「Kazuha」「Tomoko」を選択すると、「発話スタイルを上書き」のチェックボックス、および「スタンダード(レガシー)」「ニューラル発話スタイル」のオプションボックスが変更不可能となっていて「ニューラル」で固定になります。
これは、Amazon Pollyの設定画面のところで説明した「新しい音声は『ニューラル』のみに対応している」という点によるものだと思います。
おわりに
これまで、Amazon PollyあるいはAmazon Connectを使ったサービスを構築する際に、「音声は女性の声にしたいけど、『スタンダード』エンジンしか選べないので自然さに欠ける」といったお悩みを持たれていた方は、意外と多いのではないかと思います。
待望の「Amazon Polly (あるいはAmazon Connect) の日本語話者で『女性』かつ『ニューラル』に対応した音声」が利用できるようになりましたので、表現の選択の幅がグンと広がりましたね!
皆さんも、是非、新しい「Kazuha」「Tomoko」を試してみてはいかがでしょうか。